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摘要 : 为 了 解 降 香 黄 檀 叶绿体 基因 组 密码 子 使 用 模式 ， 本 研究 利用 Codon W 1.4.2 和 在 线 软 
件 CUSP 对 降 香 黄 模 叶 绿 体 基因 组 中 的 52 条 基因 编码 序列 密码 子 进行 中 性 绘图 、ENC-plot 
和 PR2-plot 分 析 。 结 果 表明 : 降 香 黄 檀 叶绿体 基因 组 密码 子 的 3 个 位 置 上 GC 含量 依次 为 


GC1 (46.01%) >GC; (38.98%) >GC3 (27.80%); 有 效 密 码 子 数 (ENC) 范 围 为 37.66 ~ 54.43， 及 


ENC 值 >45 的 有 37 个 ; RSCU >1 的 密码 子 有 29 个 , 其 中 16 个 以 U 结尾 、12 个 以 A 结尾 ; 
这 些 说 明 其 偏好 以 AT 结尾 , 且 偏 性 较 弱 。 中 性 绘图 分 析 显 示 GC 与 GC3 的 相关 系数 0.250， 
相关 性 不 显著 ， 丐 
因 有 39 个 ， 且 PR2-plot 分 析 在 碱 基 的 使 用 频率 方面 ，U > A、G > C; 说 明 降 香 黄 檀 叶 绿 体 
基因 组 密码 子 偏好 性 主要 受 选 择 的 影响 ，19 个 密码 子 被 确定 最 优 密码 子 。 本 研究 为 降 香 黄 
檀 叶 绿 体 基因 工程 、 遗 传 多 样 性 分 析 等 研究 提供 了 科学 参考 依据 。 
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系数 为 0.394; ENC-plot 分 析 显 示 ENC 比值 位 于 -0.05 ~ 0.15 区 间 的 基 
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Abstract: To comprehend the codon usage pattern of chloroplast genome in Dalbergia 


odorifera, the 52 coding DNA sequences was analyzed to obtain to the results of neutrality plot, 


ENC-plot and PR2-plot analysis using Codon W 1.4.2 and online software CUSP in the present 


study. The results showed that the GC content in the three positions of codons from the chloroplast 


genome of D. odorifera was GC1 (46.01%) >GC; (38.98%) >GC3 (27.80%) successively. The 


range of effective number codon was from 37.66 to 54.43, and there were 37 genes when ENC 


value was greater than 45. There were 29 genes when RSCU value was greater than 1, including 


the ending of 16 genes were U and 12 genes were A. These suggested that the codons preferred 


ends with AT, and had a weak bias. The neutrality plot showed that there was no significant 


correlation between GC;3 and GC1, the correlation coefficient was 0.250, and the regression 


coefficient was 0.394; ENC-plot analysis revealed that there were 39 genes which ENC ratio 


located in the section from -0.05 to 0.15; PR2-plot analysis showed that U>A and G>C in the base 


usage frequency. These all illustrated that the codon usage bias in the chloroplast genome of D. 


odorifera was mainly affected by mutation; 19 codons were identified as the optimal codon. The 


present study could be useful in the chloroplast genetic engineering and genetic diversity analysis 


of D. odorifera. 


Keywords: Dalbergia odorifera, chloroplast genome, codon usage bias, selection 
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色 (Zhang et al., 2019)， 构 成 基因 组 的 
对 应 ， 除 甲 硫 氨 酸 和 人 色 和 氨 酸 外 ， 其余 18 种 氨基 酸 均 有 2 ~ 6 个 密码 子 ， 这 些 编码 同一 氨基 酸 


的 不 同 密码 子 被 称 为 同 义 密码 子 (synonymous codon)(Duret 2002); 在 翻译 过 程 中 ,每 个 氨基 


电 的 过 程 中 , 作为 联结 核酸 和 蛋白质 的 密码 子 扮演 着 重要 的 角 


4 种 核 苷 酸 可 形成 64 种 密码 子 ， 各 密码 子 与 氨基 酸 相 


酸 相对 应 同 义 密 码 子 的 使 月 


日 频率 存在 差异 , 即 有 的 同 义 密码 子 使 用 频率 高 于 其 他 同 义 密码 子 ， 
这 种 现象 被 称 为 密码 子 偏好 性 (codon 


usage bias)(Romero et al., 2000)。 密码 子 偏好 性 广泛 存 


在 于 不 同 生物 中 ,是 物种 在 长 期 进化 过 程 中 受 环 境 选择 、 碱 基 突 变 、 基 因 漂 变 等 因素 共同 作 


] , 还 受到 基因 组 大 小 、tRNA 丰 度 和 基因 表达 水 平等 的 影响 Romero et al., 2000; Duret, 2000; 


Xu et al., 2011)。 密 码 子 偏好 性 通过 对 基因 翻译 准确 性 和 效率 的 调节 影响 基因 的 表达 水 平 ( 邢 


朝 斌 等 , 2013)， 叶 绿 体 具有 基因 组 小 、 基 因 找 贝 数 多 等 特点 (Wright，1990; 牛 元 等 , 2018); 


根据 最 优 密 码 子 设 计 叶 绿 体 基 


前 
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已 知 的 密码 子 使 用 模式 推 


E 靳 未 知 基 


因 表 达 载 体 , 可 迅速 提高 叶绿体 基因 组 中 基因 表达 量 , 利用 目 


因 的 表达 , 或 预测 某 些 未 知 基因 的 功能 (Wu et al, 2007); 
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同时 亲缘 关系 较 近 的 物种 具 相 近 的 密码 子 使 用 模式 ( 杨 国 锋 等 , 2015)， 因 此 研究 叶绿体 基因 
组 密码 子 的 使 用 模式 对 探讨 物种 进化 、 提 高 外 源 基 因 表 达 量 等 具 重要 意义 。 降 香 黄 模 
(Dalbergia odorifera) 是 嵘 形 花 科 (Papilionaceae) 黄 檀 属 (Dalbergia) 常 绿 半 落叶 乔木 , 其 心材 具 
极 高 的 经 济 和 药 用 价值 ( 梁 远 楠 等 ,2019; 王 表 琳 等 , 2019; 张 丽 佳 等 , 2019)， 本 研究 已 完成 对 
降 香 黄 檀 叶 绿 体 基 因 组 的 高 通 量 测 序 ， 通 过 分 析 降 香 黄 檀 叶 绿 体 基因 组 蛋白 编码 区 (coding 
DNA sequence，CDS) 序 列 的 碱 基 组 成 、 中 性 绘图 、ENC-plot 及 PR2-plot 等 方法 推断 影响 降 
香 黄 檀 叶 绿 体 密 码 子 偏好 性 的 主要 因素 , 确定 降 香 黄 檀 叶 绿 体 基因 组 的 最 优 密码 子 。 本 研究 
通过 对 降 香 黄 檀 叶绿体 基因 组 密码 子 使 用 模式 和 影响 密码 子 使 用 偏 性 的 因素 进行 分 析 , 确定 
降 香 黄 檀 叶 绿 体 基 因 组 的 密码 子 偏好 性 及 最 优 密码 子 , 以 期 为 降 香 黄 檀 叶 绿 体 基因 组 的 应 用 
和 研究 提供 科学 的 参考 依据 。 

1 材料 与 方法 

1.1 材料 

降 香 黄 檀 叶 片 采 自 云 南 省 林业 科学 院 热 带 林业 研 究 所 。 将 采集 的 新 鲜 叶 片 样品 保存 在 干 
冰 环 境 中 送 至 生 工 生物 工 程 (上 海 ) 股 份 有 限 公司 进行 叶绿体 基因 组 的 测序 ， 并 将 结果 提交 至 


NCBI( 登 录 号 : KC427274) ， 通 过 GenBank Feature 
Extractor(http://www.bioinformatics.org/sms2/genbank_feat.html) 、 ORF 


Finder(https://www.ncbi.nlm.nih.gov/orffinder/)、DNA man 等 软件 分 析 降 香 黄 檀 叶绿体 基因 组 ， 
根据 各 基因 的 注释 结果 获得 83 条 CDS 序列 ， 吻 除 序列 长 度 小 于 300 bp、 重 复 基 因 和 CDS 
= 内 部 存在 终止 密码 子 的 序列 后 得 到 52 条 符合 条 件 的 CDS 用 于 分 析 。 
© 1.2 方法 
1.2.1 密码 子 组 成 分 析 

将 52 条 符合 条 件 的 CDS 整合 到 一 个 .fasta 文件 中 ， 应 用 Codon W 1.4.2 软件 分 析 获 得 


各 CDS 的 ENC(effective number of codon， 有 效 密码 子 数 )、 同 义 密码 子 相 对 使 用 度 (RSCU)， 


应 用 在 线 软件 CUSP (http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp) 分 析 获 得 密码 子 第 1、 


2、3 位 碱 基 的 GC 含量 (分 别 为 GC1、GC，、GC3) 及 3 位 碱 基 的 GC 平均 含量 (GCan 等 参数 ， 
应 用 SPSS 和 Excel 等 数理 的 统计 分 析 软 件 对 结果 进行 分 析 。 

ENC(effective number of codon， 有 效 密码 子 数 ) 是 衡量 同 义 密 码 子 使 用 偏 度 的 重要 指标 ， 
ENC 的 取 值 范围 为 20 ~ 61,ENC 值 的 大 小 能 够 反映 密码 子 偏 性 的 强 弱 , 当 ENC 值 为 20 时 ， 
代表 同 义 密码 子 完全 处 于 偏 倚 状 态 ， 当 ENC 值 为 61 时， 代表 同 义 密码 子 完 全 没有 偏 倚 ; 
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ENC 值 从 小 到 大 表示 偏 倚 性 由 强 变 弱 ， 通 常 可 以 ENC 值 45 作为 区 分 偏 倚 性 强 弱 的 标准 ( 秦 
政 等 , 2018)。RSCU 是 指 某 一 密码 子 实际 使 用 频率 与 无 使 用 偏 性 时 理论 频率 的 比值 ， 无 偏 性 
时 ，RSCU 为 1 RSCU 小 于 1 则 代表 该 密码 子 的 实际 使 用 频率 低 于 其 他 同 义 密码 子 的 使 用 
频率 ， 反 之 实际 频率 高 于 其 他 同 义 密码 子 的 使 用 频率 ( 晃 岳 恩 等 , 2012)。 
应 用 SPSS 软件 分 析 密 码 子 不 同位 置 GC 碱 基 组 成 GC1、GC、GC3、GCa, 密码 子 数 (N) 
与 ENC 等 的 相关 关系 ， 进 而 判断 各 因子 对 密码 子 偏好 性 的 影响 。 
1.2.2 中 性 绘图 分 析 
简 并 密码 子 第 3 位 碱 基 通 常 所 发 生 的 为 同 义 突变 , 而 在 密码 子 第 1 位 、 第 2 位 上 发 生 的 
碱 基 突变 通常 会 改变 基因 的 功能 或 活性 ; 即 在 不 存在 外 界 压 力 时 ,密码 子 3 个 位 置 的 碱 基 含 
量 组 成 应 该 无 差异 ; 而 在 存在 一 定 选择 压力 情况 下 时 , 密码 子 3 个 位 置 上 的 碱 基 组 成 是 存在 
差异 的 (Sueoka, 2001)。 在 以 GC1 和 GC 的 平均 值 GCi1, 和 GC; 分 为 纵 、 横 坐标 的 中 性 绘图 中 ， 
每 一 个 散 点 代表 一 个 基因 。 如 果 中 性 图 中 的 所 有 基因 均 沿 对 角 线 分 布 ， 即 GC1s 和 GC; 的 
变异 基本 一 致 ， 密 码 子 3 个 位 置 上 的 碱 基 组 成 无 明显 差异 ， 受 选择 压力 较 弱 ， 而 受 突变 影响 
较 大 ; 回归 系数 (对 角 线 斜率 ) 是 衡量 中 性 程度 的 指标 之 一 ， 若 回归 曲线 斜率 极 小 ，GC1s 和 
GC 的 变异 的 相关 性 同样 很 低 ， 说 明 影响 密码 子 仿 好 性 的 主要 影响 因素 为 选择 效应 (Sueoka， 
2001)。 同 时 通过 分 析 密 码 子 不 同位 置 碱 基 组 成 的 相关 性 可 分 析 密 码 子 偏好 性 受 突变 或 选择 
的 影响 ， 即 当 GC 与 GC3 呈 显著 相关 时 ， 说 明 密码 子 3 个 位 置 的 碱 基 组 成 无 明显 差异 ， 偏 
好 性 主要 受 突变 影响 ;， 当 GC 与 GC3 呈 不 显著 相关 时 ， 回 归 系数 趋 近 于 0, 说 明 密 码 子 的 
前 两 位 碱 基 与 第 3 位 碱 基 组 成 不 同 , 基因 组 中 的 GC 含量 较为 保守 ， 密 码 子 的 使 用 偏 性 主要 
车 受 选 择 影 响 ( 杨 国 锋 等 , 2015)。 
1.2.3 ENC-plot 分 析 
ENC-plot 分 析 可 探讨 ENC 和 GC3s 分 布 的 关系 ， 是 一 种 通过 对 基因 数据 的 密码 子 偏好 
性 情况 的 图 像 可 视 化 的 有 效 方式 ,其 中 的 标准 曲线 代表 无 选择 压力 存在 时 ,密码 子 偏好 性 完 
全 由 突变 决定 ， 即 完全 由 核酸 序列 组 成 决定 密码 子 偏好 性 (Wright, 1990)。 
ENC-plot 绘图 分 析 含 散 点 图 和 标准 曲线 ， 散 点 图 则 以 ENC 为 纵 坐 标 ，GC; 为 横 坐 标 ， 标 准 
曲线 公式 为 ENC=2+GC3+29/(GC3+(1-GC3)); 具体 判断 标准 为 图 中 散 点 与 标准 曲线 的 距离 ， 
散 点 与 标准 曲线 的 距离 近 则 说 明 密码 子 偏 好 性 主要 由 碱 基 组 成 决定 , 受 翻 译 选 择 的 影响 较为 
微弱 ; 距离 远 则 说 明 密 码 子 的 ENC 值 偏 低 ， 与 基因 表达 水 平 存在 较 强 的 显著 性 相关 关系 ， 
密码 子 偏好 性 较 强 (尚明 照 等 , 2011; 王 鹏 良 等 , 2018)。 然 而 ，ENC-plot 绘图 分 析 不 足以 准确 
区 分 中 性 突变 和 选择 压力 的 影响 程度 ， 若 当选 择 出 现在 密码 子 第 3 位 碱 基 上 时 ， 需 要 结合 
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ENC 比值 频数 对 差异 进行 量化 分 析 (Sueoka, 2001)。 


1.2.4 PR2-plot 分 析 

分 析 各 密码 子 第 3 位 上 的 A、T、C、G 的 含量 ， 以 Ay(As+T3) 为 纵 坐 标 ， 以 GX(G3+C3) 
为 横 坐 标 进 行 PR2 偏 倚 分 析 (PR2-bias plot analysis) 作 图 ， 用 平面 图 显示 各 基因 的 碱 基 组 成 ， 
其 中 心 点 代表 无 偏 性 使 用 时 的 密码 子 状态 ， 即 A=T 且 C=G， 其 余 点 与 中 心 点 的 矢量 距离 则 
代表 其 偏 倚 程 度 和 方向 ( 杨 国 锋 等 , 2015)。 
1.2.5 最 优 密码 子 的 确定 

以 降 香 黄 檀 叶绿体 各 基因 的 ENC 作为 偏好 性 参考 标准 ,从 两 端 各 选择 10 多 的 基因 构建 
高 低 偏 性 库 , 将 两 库 间 A RSCU> 0.08 的 密码 子 定 为 高 表达 优越 密码 子 ; 将 RSCU 值 大 于 1 
的 密码 子 确定 为 高 频密 码 子 (尚明 照 等 , 2011)。 将 同时 满足 高 频率 密码 子 和 高 表达 优越 密码 
子 确定 为 最 优 密码 子 。 
2 结果 与 分 析 
© 2.1 密码 子 碱 基 组 成 
用 在 线 软件 CUSP 分 析 降 香 黄 檀 52 条 CDS 的 碱 基 组 成 , 用 Codon W 1.4.2 分 析 其 ENC 
值 ( 表 1)， 所 有 CDS 密码 子 的 平均 GC 含量 为 37.60%， 第 1 位 GC 含量 为 46.01%， 第 2 位 
为 38.98%， 第 3 位 为 27.80%，GC 含量 在 密码 子 的 不 同位 置 分 布 频率 不 同 ， 由 高 到 低 依次 
为 第 1 位 > 第 2 位 > 第 3 位 ， 说 明 在 降 香 黄 檀 中 ， 叶 绿 体 基因 组 密码 子 末 位 碱 基 以 A/U(T) 为 
主 ， 与 植物 叶绿体 基因 中 A/U(T) 含 量 较 高 的 特征 相符 。 表 示 偏 倚 强 弱 的 ENC 值 的 范围 为 
37.66 ~ 54.43， 平 均值 为 46.76; 52 个 CDS 的 密码 子 ENC 值 >45 的 有 36 个 ， 说 明 其 降 香 黄 
檀 大 部 分 基因 编码 序列 的 密码 子 偏 性 较 弱 。 

密码 子 不 同位 置 碱 基 的 GC 含量 、 密 码 子 数 ON) 与 ENC 值 间 的 相关 性 分 析 ( 表 2) 显 示 ， 
GCu 和 GCI、GC2、GCs3 的 相关 性 均 达 到 极 显著 水 平 ，GCI 和 GC, 达 极 显著 相关 ， GCs 与 
GC1、GC; 均 未 达到 显著 相关 ， 说 明 密 码 子 的 第 1 位 和 第 2 位 碱 基 组 成 相似 ， 与 第 3 位 碱 基 
组 成 存在 差异 。ENC 与 GC! 呈 显 著 相 关 ， 与 GCs 相关 性 不 显著 ,与 GC3 呈 极 显著 相关 ， 说 
明 ENC 与 密码 子 第 3 位 碱 基 组 成 密切 相关 。ENC 与 密码 子 数 (N) 呈 显著 相关 ， 说 明基 因 编 
码 序 列 长 度 对 密码 子 使 用 偏 性 具 一 定 影 响 。 
编码 氨基 酸 的 RSCU( 表 3) 显 示 ，RSCU >1 的 密码 子 以 A 和 1T 结尾 的 频率 较 高 ， 其 中 
16 个 以 U 结尾 、12 个 以 A 结尾 、1 个 以 G 结尾 , 说 明 降 香 黄 檀 叶绿体 基因 组 偏爱 以 A 和 UU 


结尾 ， 而 以 C 和 G 结尾 的 密码 子 为 非 偏 爱 密码 子 。 


二 


I 


表 1 降 香 黄 檀 叶绿体 CDS 密码 子 各 位 置 的 GC 含量 
Table 1 GC proportion in different position of each CDS from the chloroplast genome of 


Dalbergia oleifera 


三 因 基因 
GCI GC> GC3 GCall ENC GC1 GC> GC3 GC ENC 
Genes Genes 


accD 38.84 34.86 29.08 34.26 45.54 | psbA 49.72 43.22 31.64 41.53 42.35 
atpA 54.60 40.12 27.98 40.90 47.67 | psbB 55.21 46.56 30.45 44.07 49.03 
atpB 56.91 40.88 28.46 42.08 48.09 | psbC 53.38 45.78 32.28 43.81 47.64 
atpE 47.76 38.81 27.61 38.06 47.90 | psbD 51.98 43.22 31.64 42.28 44.56 
atpF 45.65 32.07 30.98 36.23 49.66 | rbcL 57.14 43.49 29.83 43.49 47.75 
atpl 47.98 35.08 25.00 36.02 42.30 | rpl14 50.41 37.4 28.46 38.75 S51.06 
ccsA 29.63 36.73 25.93 30.76 41.62 | rpl16 50.00 52.94 29.41 44.12 42.05 
cemA 38.26 29.13 31.74 33.04 53.55 | rpl2 50.92 48.35 31.5 43.59 54.43 
clpP 58.38 36.55 30.46 41.79 51.97 | rpl20 35.00 37.50 25.00 32.50 48.31 
matKk 36.24 29.26 28.68 31.40 49.51 | rpoA 43.98 30.12 25.3 33.13 44.62 
ndhA 40.66 37.91 21.15 33.24 43.48 | rpoB 49.58 37.35 28.85 38.59 49.33 
ndhB 42.19 39.13 31.85 37.73 49.36 | rpoCl1 49.19 37.19 25.18 37.19 49.00 
ndhC 45.45 33.88 24.79 34.71 44.88 | rpoC2 41.47 35.19 26.16 34.27 46.81 
ndhD 37.70 37.96 30.37 35.34 47.25 | rps11 52.52 S54.68 24.46 43.88 51.52 
ndhE 39.22 33.33 26.47 33.01 43.95 | rps12 52.42 48.39 32.26 44.35 42.85 
ndhF 35.98 33.07 23.54 30.86 42.76 | rps14 43.56 47.32 24.75 38.61 39.85 
ndhG 44.63 35.59 23.16 34.46 44.13 | rps18§ 36.54 40.38 25.00 33.97 37.66 
ndhH 51.27 35.53 25.63 37.48 49.12 | rps2 40.51 40.93 27.85 36.43 46.71 
ndnl 41.57 36.14 23.49 33.73 47.31 | rps3 42.92 33.79 21.00 32.57 47.49 
ndhJ 49.69 37.11 27.04 37.95 48.08 | rps4 50.99 36.14 24.75 37.29 45.40 
ndhK 45.79 44.39 27.57 39.25 47.67 | rps7 52.56 44.87 23.72 40.38 46.53 
petA 53.58 36.45 29.91 39.98 47.00 | rps8 37.78 40.74 26.67 35.06 41.20 
petB 46.76 41.67 30.09 39.51 42.20 | yc 33.56 28.21 25.09 28.95 47.45 
petD 50.31 39.13 21.12 36.85 38.83 | ycf2 41.84 34.14 36.46 37.48 52.54 
psaA 51.66 43.28 32.49 42.48 51.63 | ycf3 47.93 38.46 30.18 38.86 51.50 


psaB 48.57 43.13 30.34 40.68 48.28 | yc 所 42.19 39.06 32.81 38.02 50.02 
平均 数 


46.01 38.98 27.80 37.60 46.76 
Average 


注 : GCan 表 示 密 码 子 各 位 置 的 平均 数 。 
Notes: GCan represents the average of different position of codons. 
表 2 密码 子 各 位 置 GC 含量 、 数 量 与 ENC 值 的 相关 性 分 析 


Table 2 Correlation analysis of GC content of different codon position, numbers and ENC value 


变量 GC GC GC; GC ENC 
Variation 

GC, 0.504** 

GC 0.249 0.201 

GC 0.861** 0.805** 0.515** 

ENC 0.251* -0.088 0.466** 0.230 

密码 子 数 (N) -0.156 -0.277* 0.262* -0.142 0.270* 
Codon numbers(N) 


主 : ** 在 0.01 水 平 上 显著 相关 ; * 在 0.05 水 平 上 显著 相关 。 


二 < 
Pi 


Notes: ** means significant correlation at P< 0.01; * means significant correlation at P< 0.05. 


表 3 降 香 黄 檀 各 氨基 酸 的 RSCU 分 析 


Table 3 RSCU analysis of protein coding region in Dalbergia oleifera 


人 Le we Cs Re an co a pe 
Phe UUU 843 1.36 Pro CCU 324 1.50 Lys AAA 938 1:35 
UUC 393 0.64 CCC 245 0.99 AAG 271 0.45 
Leu UUA 738 1.99 CCA 246 1.14 Asp GAU 694 1.65 
UUG 492 1.32 CCG 117 0.54 GAC 147 0.35 
CUU 447 1.20 Thr ACU 430 1.63 Glu GAA 847 1.49 
CUC 134 0.36 ACC 197 0.75 GAG 293 0.51 
CUA 286 0.77 ACA 331 1.25 Cys UGU 176 1.46 
CUG 133 0.36 ACG 99 0.37 UGC 65 0.54 
lle AUU 932 1.46 Ala GCU 524 1.80 Arg CGU 297 1.41 
AUC 350 0.55 GCC 192 0.66 CGC 80 0.38 
AUA 633 0.99 GCA 332 1.14 CGA 290 1.37 
Val GUU 414 1.48 GCG 119 0.41 CGG 82 0.39 
GUC 124 0.44 Tyr UAU 656 1.65 AGA 391 1.85 
GUA 429 1.53 UAC 141 0.35 AGG 127 0.60 
GUG 155 0.55 His CAU 388 1.56 Ser UCU 468 1.79 
Gly GGU 506 1.36 CAC 110 0.44 UCC 245 0.94 
GGC 148 0.40 Gln CAA 613 1.59 UCA 301 1.19 
GOA 589 1.58 CAG 160 0.41 UCG 152 0.58 
GGG 246 0.66 Asn AAU 838 lS7 AGU 303 1.16 
AAC 229 0.43 AGC 127 0.38 


注 : 下 划 线 表示 最 优 密 码 子 。 


Notes: The codon having underline represents the optimal codon. 


2.2 中 性 绘图 分 析 


i 


降 香 黄 檀 叶 绿 体 基 因 组 各 基因 的 中 性 绘图 分 析 ( 图 1)，GC, 的 取 值 范围 稍 大 在 0.309 ~ 
0.536 之 间 ，GCs3 的 取 值 范围 很 小 在 0.210 ~ 0.365 之 间 ， 基因 均 落 在 对 角 线 上 方 ; GCT 


与 GC3 的 相关 系数 0.249 6， 相 关 性 不 显著 ， 且 回归 系数 ( 即 趋 势 线 的 斜率 ) 为 0.393 8， 即 在 
降 香 黄 檀 叶 绿 体 基 因 组 中 性 绘图 分 析 中 ，GCi 和 GC 两 个 变量 间 的 相关 性 很 弱 ， 说 明 密 码 


子 第 1 位 、 第 2 位 和 第 3 位 碱 基 组 成 存在 差异 ， 即 降 香 呐 檀 叶 绿 体 基 因 组 中 GC 含量 高 度 保 


守 ， 且 密码 子 第 3 位 的 GC 含量 较 低 ， 其 密码 子 偏好 性 更 多 地 受 选 择 的 影响 。 
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y=0.393 8x + 0.318 
R?= 0.0623 


1 中 性 绘图 分 析 
Fig.1 Neutrality plot analysis 
2.3 ENC-plot 绘图 分 析 


ENC-plot 绘图 分 析 是 以 ENC 比值 [( 预 期 ENC 值 -实际 ENC 值 y 预 期 ENC 值 ] 和 ENC 比 
值 频 数 来 判断 影响 基因 的 主要 因素 , 与 标准 曲线 的 距离 近 的 基因 数量 较 多 , 则 其 偏好 性 主要 
受 突变 的 影响 ， 反 之 选择 为 主要 影响 影响 。 分 析 结 果 ( 图 2) 显 示 ENC 比值 频数 表 ( 表 4 中 分 


布 在 -0.05 ~ 0.05 区 间 的 基因 有 14 个 ， 即 有 14 个 基因 与 预期 ENC 值 较 接近 ， 而 分 布 在 -0.05 


~ 0.05 区 间 之 外 的 基因 有 38 个 , 这 38 个 基因 与 预期 ENC 值 较 远 , 与 标准 曲线 的 距离 较 远 。 
本 研究 中 的 降 香 黄 檀 叶 绿 体 基 因 组 中 的 大 多 数 基因 与 标准 曲线 距离 较 远 , 说 明 降 香 黄 檀 叶 绿 
体 基 因 组 密码 子 偏好 性 更 多 地 受 选 择 的 影响 ， 而 受 突变 的 影响 较 弱 。 


密码 子 数 
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图 2 ENC-plot 绘图 分 析 
Fig.2 Analysis of ENC and GC3 relationship 
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表 4ENC 比值 频数 分 布 表 
Table 4 Distribution of ENC ration 


组 段 组 中 值 频数 频率 
Class range Class mid value Frequency number Frequency 
-0.15~-0.05 -0.10 5 0.10 

-0.05 ~ 0.05 0 14 0.27 

0.05 ~ 0.15 0.10 25 0.48 

0.15 ~ 0.25 0.20 6 0.12 

0.25 ~ 0.35 0.30 2 0.04 

合计 Total 52 1 

2.4 PR2-plot 绘图 分 析 


通过 PR2-plot 绘图 进一步 分 析 降 香 黄 檀 叶 绿 体 基 因 组 密码 子 偏好 性 的 影响 (图 3)，PR2 
平面 图 中 4 个 区 域 的 散 点 分 布 不 均匀 ,大 部 分 基因 位 于 处 于 平面 图 的 下 半 部 , 尤其 是 右 下 方 
的 基因 数量 最 多 , 说明 在 碱 基 的 使 用 频率 方面 ，U > A、G > C。 如 果 密 码 子 偏好 性 完全 受到 
突变 的 影响 ， 则 4 个 碱 基 的 使 用 频率 相当 ， 因 此 ， 降 香 黄 檀 叶 绿 体 基 因 组 密码 子 偏好 性 同时 
受到 突变 和 选择 的 影响 。 


EE 
i 
3 05 


0.5 
G3/(G3+C3) 


图 3 PR2-plot 绘图 分 析 
Fig.3 Analysis of PR2 bias plot 


2.5 最 优 密码 子 确定 

将 降 香 黄 檀 叶 绿 体 基 因 组 中 的 52 条 蛋白 编码 基因 作为 一 个 整体 在 Codon W 1.4.2 软件 
上 运行 ， 通 过 构建 高 表达 基因 和 低 表 达 基 因 库 ， 分 别 计算 这 两 个 基因 库 中 的 RSCU 值 ， 结 
果 显 示 ( 表 3)，A RSCU>0.08 的 密码 子 ， 分 别 为 UUU(TTT)、UUA(TTA) 等 23 个 密码 子 为 
高 表达 的 优越 密码 子 ( 表 5 中 用 * 表 示 ), 其 中 11 个 以 A 结尾 ,8 个 以 TU 结尾 ,3 个 以 C 结尾 ， 


1 个 为 G 结尾 ; A RSCU 宇 0.3( 表 5 中 用 ** 表 示 ) 的 密码 子 有 11 个 ; A RSCU= 三 0.5( 表 5 中 用 


*** 表 示 ) 的 密码 子 分 别 为 UUU、UUA。 以 同时 满足 高 频率 密码 子 和 高 表达 优越 密码 子 作为 


最 优 密码 子 ， 分 别 为 UUU、UUA、AUA、GUA、UCA、AGU、CCA、UAU、GCA、CAU、 


CAA、AAU、AAA、GAA、UGU、CGA、AGA、GGU 和 GGA 等 19 个 ， 其 中 12 个 以 A 


NS 


结尾 ，7 个 以 U 结尾 。 


表 5 降 香 黄 檀 叶绿体 基因 组 最 优 密 码 子 的 确定 
Table 9 Preferred codons in chloroplast genome of Dalbergia odorifera 
高 表达 基因 低 表 达 基 因 高 表达 基因 低 表 达 基 因 
密码 子 High expression gene & Low expression gene 密码 子 High expression gene Low expression gene 
酸 ARSCU 酸 ARSCU 
Codon 数 Codon 数 日 
AA RSCU RSCU AA RSCU RSCU 
Number Number Number Number 
Phe UUU*** 43 1.69 132 1.07 0.62 Ala GCU 17 1.39 70 1.62 -0.23 
UUC 8 0.31 114 0.93 -0.62 GCC 6 0.49 31 0.72 -0.23 
Leu UUA*** 56 3.23 85 1.29 1.98 GCA** 21 1.71 54 1.25 0.46 
UUG 20 1.15 96 1.41 -0.26 GCG 入 0.41 18 0.42 -0.01 
CUU 21 1.21 94 1.38 -0.17 His CAU* 14 1.65 97 1.56 0.09 
CUC 0 0.00 36 0.53 -0.53 CAC 3 0.35 27 0.44 -0.09 
CUA 5 0.29 63 0.92 -0.63 Gln CAA** 22 1.76 102 1.45 0.31 
CUG 2 0.12 35 0.51 -0.39 CAG 3 0.24 39 0.55 -0.31 
lle AUU 42 1.34 134 1.30 0.04 Asn AAU* 39 1.70 155 1.49 0.21 
AUC 16 0.51 71 0.69 -0.18 AAC 活 0.30 53 0.51 -0.21 
AUA* 36 1,15 105 1.02 0.13 Lys AAA** 49 1.75 144 1.38 0.37 
Val GUU 15 1.33 56 1.27 0.06 AAG 7 0.25 65 0.62 -0.37 
GUC 7 0.62 29 0.66 -0.04 Asp GAU 14 1.40 160 1.65 -0.25 
GUA** 20 1.78 65 1.48 0.30 GAC* 6 0.60 34 0.35 0.25 
GUG 3 0.27 26 0.59 -0.32 Glu GAA* 32 1.52 123 1.28 0.24 
Ser UCU 21 1.62 89 1.61 0.01 GAG 10 0.48 69 0.72 -0.24 
UCC 6 0.46 03 1.14 -0.68 Cys UGU** 8 1.78 33 1.43 0.35 
UCA* 19 1.46 66 1.20 0.26 UGC 1 0.22 13 0.57 -0.35 
UCG** 14 1.08 36 0.65 0.43 Arg CGU* 14 1.06 39 0.98 0.08 
AGU* 17 1.31 58 1.05 0.26 CGC 3 0.23 16 0.40 -0.17 
AGC 1 0.08 19 0.34 -0.26 CGA* 21 1.59 52 1.30 0.29 
Pro CCU 14 1.30 $57 1.42 -0.12 CGG 5 0.38 24 0.60 -0.22 
CCC* 10 0.93 33 0.82 0.11 AGA** 29 2.20 70 1.75 0.45 
CCA* 15 1.40 46 1.15 0.25 AGG 水 0.53 39 0.98 -0.45 
CCG 4 0.37 24 0.60 -0.23 Gly GGU* 24 1.45 79 1.32 0.13 
Thr ACU 18 1.33 02 1.39 -0.06 GGC 9 0.55 25 1.42 -0.87 
ACC** 15 1.11 35 0.79 0.32 GGA 25 1.32 89 1.48 0.04 
ACA 14 1.04 01 1.37 -0.33 GGG 8 0.48 47 0.78 -0.30 
ACG 7 0.52 20 0.45 0.07 
Tyr UAU** 26 1.86 100 L354 0.32 
UAC 2 0.14 30 0.46 -0.32 
* 表 示 A RSCU 宇 0.08, ** 表 示 A RSCU 之 0.3, *** 表 示 A RSCU 宇 0.5。 
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* meanA RSCU 之 0.08, ** meanA RSCU 过 0.3, *** meanA RSCU 过 0.5. 
3 讨论 与 结论 

在 生物 体 中 , 密码 子 在 核酸 和 蛋白 质 的 翻译 方面 扮演 着 重要 作用 ; 植物 中 不 同 密码 子 的 
使 用 频率 存在 差异 , 这 种 密码 子 使 用 偏好 性 是 物种 和 基因 长 期 进化 和 对 环境 的 适应 过 程 中 形 
成 的 , 是 由 于 多 种 因子 共同 作用 的 结果 , 其 中 突变 和 自然 选择 是 该 现象 形成 的 重要 影响 因素 
(Romero et al., 2000; Xu et al., 2011)。 叶绿体 是 植物 进行 光合 作用 的 细胞 器 ， 亦 含 有 相对 独立 
的 母系 遗传 基因 组 信息 ， 故 叶绿体 基因 组 在 揭示 物种 进化 、 不 同 物种 间 亲 缘 关 系 、 物 种 鉴定 
等 方面 具 重 要 价值 ; 同时 叶绿体 基因 工程 因 其 可 高 效 表 达 、 安 全 等 特点 已 成 为 植物 基因 工程 
的 研究 热点 (Wright, 1990; Duret, 2000)。 因 此 ， 植 物 叶 绿 体 基因 组 密码 子 使 用 偏 性 的 研究 能 


够 揭示 物种 基因 组 进化 关系 及 主要 影响 因素 。 


> 中 性 进化 理论 认为 碱 基 突 变 和 自然 选择 对 密码 子 第 3 位 碱 基 变化 的 影响 是 中 性 或 近 中 
9 性 的 (Sharp et al., 1993)， 即 通常 密码 子 的 第 1 位 、 第 2 位 碱 基 的 改变 会 造成 编码 氨基 酸 的 改 
S 变 , 而 第 3 位 碱 基 改 变 则 对 氨基 酸 编码 无 影响 , 可 以 认为 密码 子 使 用 偏 性 在 某 种 程度 上 是 对 
© 偏好 密码 子 使 用 与 非 偏好 密码 子 保留 间 的 一 种 平衡 ,是 进化 过 程 中 的 一 种 自我 保护 机 制 ; 同 
© 时 因 密 码 子 第 3 位 碱 基 具 有 的 兼并 性 及 较 小 的 选择 压力 、GC3 含量 与 密码 子 使 用 偏 性 的 显著 


相关 性 等 因素 ， 通 常 将 GC; 作为 密码 子 使 用 模式 分 析 的 重要 依据 (Gu et al., 2004; Ingvarsson， 
2007)。 本 研究 中 降 香 黄 檀 叶绿体 基因 组 密码 子 的 GC 含量 远 低 于 前 两 位 ， 与 艾 荧 首 蒂 


(Medicago truncatula)( 杨 国 锋 等 , 2015)、 紫 花 首 适 UMedicago sativa)( 陶 晓 丽 , 2017) 的 密码 子 3 


个 位 置 的 GC 含量 进行 比较 ， 即 紫花 首 蒂 GC1(45.24 %) > GC2(37.30 %) > GC3(28.97 %)， 获 


莹 首 带 GC1(45.5 %) > GC2(36.8%) > GC3(26.9 %)，3 个 物种 叶绿体 基因 组 在 密码 子 3 个 位 置 


上 的 GC 含量 趋势 一 致 ， 但 具体 数据 存在 一 定 的 差异 。 中 性 绘图 分 析 显 示 ， 密 码 子 第 1 位 和 
第 2 位 与 第 3 位 碱 基 组 成 存在 显著 差异 , 通过 其 GC 含量 高 度 保守 ， 其 密码 子 偏 好 性 主要 受 
选择 影响 ;与 获 莹 首 蒂 一 致 ( 杨 国 锋 等 , 2015); 同时 结合 ENC-plot 和 PR2-plot 等 分 析 方 式 发 
现 降 香 黄 檀 叶绿体 基因 组 密码 子 的 偏好 性 受 多 种 因素 综合 影响 , 主要 影响 因素 为 选择 ; 这 个 
结论 与 其 同 科 植物 获 荧 首 带 (Medicago truncatula)( 杨 国 锋 等 , 2015) 一 致 。 降 香 黄 檀 叶 绿 体 基 
因 组 密码 子 偏 好 以 AT 结尾 ， 且 其 最 优 密码 子 为 UUU、UUA， 与 大 多 数 高 等 植物 的 最 优 密 
码 子 NNA、NNU 的 模式 一 致 (尚明 照 等 , 2011)。 这 种 密码 子 使 用 模式 可 能 由 于 叶绿体 基因 组 
中 含有 丰富 的 AT 碱 基 ， 且 其 密码 子 使 用 模式 存在 显著 差异 ， 而 在 进化 和 亲缘 关系 较 近 的 植 


物 通常 具 相 似 的 密码 子 使 用 模式 , 叶绿体 基因 组 密码 子 的 仿 好 性 在 进化 关系 上 较为 保守 。 本 
研究 中 降 香 黄 檀 叶绿体 基因 组 密码 子 偏好 性 主要 受 突 变 的 影响 , 同时 与 其 他 因素 一 起 共同 作 


于 其 密码 子 使 用 模式 ,确定 了 19 个 最 优 密码 子 ， 且 均 为 NNA 和 NNU 模式 。 降 香 黄 檀 的 
分 布 区 较为 零散 ， 仅 分 布 海南 全 岛 ， 及 广东 、 广 西 和 福建 省 的 少数 地 区 ( 张 丽 佳 等 ,2019)， 

但 降 香 黄 模 叶 绿 体 基 因 组 密码 子 的 偏好 性 与 其 他 蝶 形 花 科 植物 基本 一 致 ， 未 表现 出 特异 性 ， 
说 明 蝶 形 花 科 植物 至 少 在 密码 子 偏好 性 方面 亦 较为 保守 。 本 研究 为 以 后 降 香 黄 模 通 过 外 源 基 
密码 子 改造 的 异 源 表达 、 叶 绿 体 基 因 工 程 和 遗传 多 样 性 分 析 提 供 了 科学 的 参考 依据 。 


Es 
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